计量经济学笔记(2):假设检验、t 统计量、p 值 您所在的位置:网站首页 计量经济学 eviews y减去一啥意思 计量经济学笔记(2):假设检验、t 统计量、p 值

计量经济学笔记(2):假设检验、t 统计量、p 值

2024-04-16 23:13| 来源: 网络整理| 查看: 265

注:本文为计量经济学学习笔记,主要参考各类主要计量经济学教材学习整理而得(笔记二主要是伍德里奇《计量经济学导论》第六版英文原版第四章的内容整理),内容未必完全正确,会随学习过程的不断推进补充、修改和更正,请谨慎参考,如有错误,欢迎指正。1、为什么要对回归系数进行假设检验?

假设我们利用最小二乘方法,想要研究学校的规模( enroll )对学生数学成绩( math )的影响,并加入学校的教职工人数( staff )和教师平均年薪( totcomp )作为控制变量,基于一个观测值个数为408( n=408 )的样本,我们得到了如下方程(课本中的 EXAMPLE 4.2):

math=2.274+0.00046\ totcomp + 0.048\ staff - 0.0020\ enroll

我们观察到,主要解释变量——学校规模的系数是 -0.0020,我们仅仅基于此就得出学校规模越大、学生的数学成绩越低的结论呢?不太能,很显然,我们现在进行的工作是用一个样本去估计总体的性质, \hat\beta_{enroll} 是一个估计量(estimator,估计量不是一个数,而是一个表达式、是函数),这里的 -0.0020 只是该估计量的一次实现值。因此,我们希望知道 \hat\beta_{enroll} 的抽样分布(sampling distribution),并结合研究这个 -0.0020 的值在这个分布下,是否足以说明,在总体回归中,学校规模对学生数学成绩的影响是负的。

2、对单个总体参数进行假设检验:t 检验

在中心极限定理以及满足高斯-马尔可夫假定、同方差假定以及干扰项服从标准正态分布的情况下,统计量 (\hat{\beta_j}-\beta_j)/se(\hat{\beta_j}) 服从自由度为 n-k-1 的 t 分布(这里,下标 j 代表自变量 x_j , \beta_j 是总体参数, \hat{\beta_j} 是这个总体参数的估计量),至于为什么这个统计量服从的是 t 分布,证明是较为困难的,可以简单理解为图1的过程,但应该注意到,由于样本标准误是总体标准差的估计量,这个 t 统计量衡量的是以标准差为单位,估计量 \hat\beta_{enroll} 与总体参数 \beta_j 之间的偏离程度。

图1:t 分布的简单证明

图2:《Introductory Econometrics: A Modern Approach》 Jeffery M.Wooldridge (6th section P108)

所以 t 检验的本质和直观理解是,一旦我们设定了回归方程的变量(获得包含常数项的变量个数 k+1 ),并获得了样本数据(获得 n 的具体值),我们就确定了上述 t 分布的自由度,在对总体参数进行假定后,可以根据自由度画出如图 2 所示的分布图。举个例子具体说明,比如说现在我们的数据有104个观测值(n = 104),回归方程中有三个自变量和一个常数项(k + 1 = 4),那么此时自由度为 n-k-1=100 ,统计量 (\hat{\beta_j}-\beta_j)/se(\hat{\beta_j}) 服从自由度为 100 的 t 分布。如果我们认为总体参数 \beta_j 是10,那么在根据OLS计算得出 \hat\beta_{enroll} 后,我们就可以直接算出这一次抽样的 t 值,如果这个 t 值非常靠近分布的两侧尾端,那说明仅仅在一次抽样中就发生了小概率事件(我们认为的基本原则是,小概率事件在一次实验中不可能发生,所以,正常来说,t 值应该大概率分布在 0 值周围,而不是极端值),那我们就有理由认为总体参数不是 10,从而拒绝原先对总体参数的假设。那么,这一次实现的 t 值要有多极端才能有理由说明总体参数可能根本就不是 10 呢?我们需要确定一个拒绝原假设的规则,这个规则的选定就是显著性水平(significance level)

WHY to have a t statistic here in a hypothesis test?We need to know that whether the deviation from the population parameter is large enough to warrant the rejection of null hypothesis. As with all testing, the answer depends on the significance level of the test. But we cannot carry out a test at a chosen significance level until we have a statistic whose distribution is known. Therefore, we construct a t statistic here, and since we know the exact form of t distribution, we can easily carry out our hypothesis test.图3:不同自由度下的 t 分布图像3、拒绝原假设的规则:显著性水平(significance level)3.1 单边备择假设(one-side alternatives)

假定我们的原假设是 H_0:\beta_{j}=0 ,备择假设是 H_1:\beta_{j}>0

注意:假设检验的对象是总体参数,是对总体参数性质的假设,不是对 OLS 估计量的假设

如果我们想拒绝原假设,接受备择假设,也就是希望 \beta_j 是大于 0 的,那么根据回归得到的 \hat\beta_j 以及相应的 t_{\hat\beta_j} ,如果 \hat\beta_j 足够大,从而 t_{\hat\beta_j} 足够大,那我们就更能说明系数实质上是大于 0 的。也就是说,我们把拒绝的规则设定为如果 t_{\hat\beta_j}>c ,我们就拒绝原假设并认为系数大于 0。进一步,我们把这个阈值 c 进行统一,如果 c 是 5%分位数,那么显著性水平就是 5%,如果 t_{\hat\beta_j} 比这个 5% 分位数还要极端,那我们就拒绝原假设。同理,还可以设定常见的 10%、15%的显著性水平。个人理解,显著性水平事实上就是一个设定,是对”极端值“的定义水平。

还是用例子来理解(课本中的 EXAMPLE 4.1),假设我们有如下的回归方程:

log(wage)=.284+.092\ educ+.0041\ exper+.022\ tenure \

其中,样本量 n=526 , se(\hat\beta_{exper})=0.0017 ,若原假设为 H_0:\beta_{exper}=0 、备择假设为 H_1:\beta_{exper}>0 ,那么,对该对假设进行假设检验的步骤如下:

1、计算 t 值

t=\frac{\hat\beta_{exper}-\beta_{exper}}{se(\hat\beta_{exper})}=\frac{0.041-0}{0.017}\approx2.41

2、计算自由度,并根据显著性水平计算 t 值的临界值 c(critical value)

自由度 df = 526 - 3 - 1 = 522 ,计算各种显著性水平下的临界值,这里可以用 Stata 使用di (display) 命令结合 invttail() 函数来查询t分布的临界值:

di invttail(522, 0.05) di invttail(522, 0.01)

输出的结果分别为 1.6477779 和 2.3335127,由于 t=2.41>c_{1\%}=2.33 ,所以,该系数在 1% 的显著性水平上,显著大于 0 。

3.2 双边备择假设(two-side alternatives)

在没有明确地指明备择假设时,我们通常都认为备择假设时双边的,同时,Stata 回归中报告的 p 值(第4节内容)都是检验参数为 0 的双边备择假设。

双边备择假设也很好理解,在 3.1 节的单边备择假设检验中,我们只关心系数是否”极左“”极右“。如果原假设是参数等于 0 ,备择假设是参数大于零,那么只有在 t 值比较大、在 t 分布的右端,我们才能有理由拒绝原假设(备择假设为参数小于零的情况同理)。然而,在双边假设检验下,备择假设为 H_1:\beta_j\ne0 只要 t 值靠近两端,我们就有理由说总体参数不是 0,这时候,拒绝的规则就会变为 |t_{\hat\beta_j}|>c ,而这里的临界值相对于单边假设检验而言,就要做出显著性水平减半的调整,这里不再详细举例说明。

4、p 值(p value)

大多数计量经济学教科书对 p 值的定义为:给定 t 统计量的观测值,拒绝原假设的最小显著性水平

本人初学时看这句话看了 n 遍,仿佛每个字我都认识但是连起来像是外星人在说话

各大教科书对 p 值的数学定义和解释都很详细(这里不再详细阐述数学的部分),但似乎缺乏一些直观的理解,下面以双边备择假设检验为例,分享一下个人对 p 值的直观理解:

图4:《Introductory Econometrics: A Modern Approach》 Jeffery M.Wooldridge (6th section P119)

如图3,假设我们已经计算出来的双边假设检验的 t 值是如上图所示的 1.85,那么 p 值在双边备择假设的情况下,就是 t 统计量的绝对值分布在 1.85 两侧的概率,即图中的蓝色面积部分。至于为什么说, p 值的定义为:给定 t 统计量的观测值,拒绝原假设的最小显著性水平,可以这样理解:

根据自由度,我们先分别计算各个显著性水平对应的临界值,并在分布图中标注出来(图中的紫色线和绿色线),如果要在 5% 的水平下拒绝原假设,那么,t 统计量的观测值要落入紫色线的外侧(拒绝域),橙色线(10%显著水平)也是如此。现在,t 值为 1.85,落入了 10% 显著性水平的拒绝域,所以我们能在 10% 的水平下拒绝原假设。所以,只有 p 值比拒绝域对应的概率大,才能拒绝原假设,这就解释了为什么p 值的定义为:给定 t 统计量的观测值,拒绝原假设的最小显著性水平

再浅显一点,说白了,“给定 t 统计量的观测值”,就是说,要根据回归得到的系数的估计值、标准误以及假定的总体参数,按图1中的公式 [4.3] 计算 t 值;只有这个观测值比显著性水平对应的临界值更极端(在双边备择假设下,就是位于临界值的右侧),我们才能拒绝原假设,即“p值是拒绝原假设的最小显著性水平”。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有